
20K合成数据就能让大模型能力飙升!还能实现模型自我迭代,上海AI Lab数据合成新范式
20K合成数据就能让大模型能力飙升!还能实现模型自我迭代,上海AI Lab数据合成新范式仅使用20K合成数据,就能让Qwen模型能力飙升——
仅使用20K合成数据,就能让Qwen模型能力飙升——
随着语言大模型的成功,视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速,但在长上下文场景下表现却不尽如人意,这一问题严重制约了多模态模型在实际应用中的潜力。
本文将介绍首个关于 o1 类长思维链模型过度思考现象。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。
百万真机数据集开源项目AgiBot World,也是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。 该项目由稚晖君具身智能创业项目智元机器人,携手上海AI Lab、国家地方共建人形机器人创新中心以及上海库帕思联合发布。
本文介绍了一套针对于低比特量化的 scaling laws。
无需额外模型训练、即插即用,全新的视频生成增强算法——Enhance-A-Video来了!
新模型在MATH上(以数学竞赛为主)动辄跑分80%甚至90%以上,却一用就废。
Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。
2023年紧急成立的Seed团队,某种程度上承担了AI Lab最初成立时被赋予的角色;
一个理想的GAME Agent是什么样的? 让你分不出来跟你互动的是真人还是AI。 这是带领腾讯AI Lab开发出「绝悟AI」、「绝艺AI」的刘永升的回答,他现在的身份是超参数科技创始人、CEO。